2006 Paul ConvNMF
Convolutive Non-Negative Matrix Factorisation with a Sparseness Constraint
2006 16th IEEE Signal Processing Society Workshop on Machine Learning for Signal Processing
Paul D. O'Grady, Barak A. Pearlmutter
データセットの構造を反映する表現を発見することは、多くの推論および学習方法の最初のステップです。この論文は、部分として解釈できるローカライズされた音声特徴の階層を見つけることを目的とします。非負値行列因子分解 (NMF) は、部分ベースのローカライズされた加法表現の発見のために最近提案されました。著者は、共有重みを持つ特定のローカル接続性を強化するこの方法の変形である畳み込み NMF を提案します。分析はスペクトログラムから始まります。畳み込み NMF によって生成された隠れた表現は、次の上位レベルで同じ分析方法に入力されます。畳み込み NMF を繰り返し適用すると、ますます抽象的な一連の表現が生成されます。これらの音声表現は部分ベースであり、複雑な高レベルの部分はそれほど複雑ではない低レベルの部分によって定義されます。